都市圈研究 | 以大数据视野发现别样的都市圈
Photo by Hunter Bryant on Unsplash
以都市圈为核心的新型城镇化将成为中国未来经济增长的压舱石。对于都市圈的研究,既要基于经济、社会、地理科学的相关理论基础,也需要运用新的研究方法。产新智库都市圈研究中心探索运用大数据方法研究都市圈。在大数据的视野下,我们发现了一个更加精彩的都市圈。
都市圈是基于现有城市和城市群规划与管理问题而提出的创新性理念。我国城市在规划中首先把城市范围定义为所在城市的行政区范围。但现实中城市的功能范围往往与行政范围错位,以北京为例,燕郊、北三县等地在实际发展中受北京的影响要明显高于其所在上级行政区域。城市群的规划管理更多是从国家层面的宏观区域管理出发,城市群内的各城市间存在联系不够紧密,相互作用不强等问题。都市圈是在城市群内依托于一个特大城市,与周边中小城市(镇)共同发展形成的高度融合的网络状城镇体系。简单来讲,我们可以把都市圈理解为一个城市功能实际所能服务的地域范围。都市圈理论意味着我们对城市的认识要跨越行政界限的约束,这就要求我们在研究时必须突破传统的统计方法。数字化的全面普及让我们用大数据方法研究都市圈成为可能。
作为一项新兴事物,大数据至今仍没有一个广泛认同的定义,甚至有观点认为不能用EXCEL处理的数据都叫大数据。从应用角度,我们可以认为大数据是所有可以被收集到的,但无法用传统流程处理或分析的信息,包括传统企业数据、机器和传感器数据、社交数据。抛开虚头巴脑的概念,大数据的快速发展与其在应用端的颠覆性价值密不可分。以研究应用为例,传统统计方法离不开抽样调查与建模测算。统计结果是否准确一方面取决于样本量,另一方面取决于模型的准确程度。要追求结果的极致精确:一是尽可能追求样本最大化,二是无限增加模型的复杂程度和运算量。而大数据方法下,网络终端的全面覆盖意味着样本几乎可等同总量,而云计算和分布式计算让我们有能力对海量数据进行处理,样本与总体界限消失的理想变为现实。
图:用大数据方法提取的大数据实时相关热词
图片来源:云奥大数据、产新智库
正如新千年伊始个人电脑、互联网的兴起催生了百度、腾讯、阿里巴巴等大批互联网巨头,2010年来智能手机、移动终端的兴起带来了小米、滴滴、美团等一大批独角兽企业,随着智能终端的普及,大数据企业也大有“忽如一夜春风来,千树万树梨花开”的态势。据统计,我国大数据总体产值规模已达4700亿,核心产值规模达576亿,涉及大数据相关业务的企业数量已有13026家。按照数据来源和应用领域不同,我们大致可以把大数据企业或平台归纳为综合大数据、商业大数据、时空大数据、企业大数据四类。
图片来源:产新智库
从对大数据平台梳理可以看出,目前大数据行业在研发端的技术和能力日趋成熟,而应用场景端无疑存在着一片巨大的蓝海。大数据在理论上也许并没有太强的创新,但对都市圈的研究来讲无异于一剂催化剂。在都市圈的研究中,我们不断探索运用最新的大数据方法,取得了很好的成效。
应用1:都市圈人口规模预测
人口问题一直是城市研究中的核心问题之一。传统方法对人口规模的预测主要基于人口抽样调查和公安管理数据,也有通过用水用电甚至食盐消费量进行的辅助估测。移动终端的广泛普及使我们能够通过大数据方法对指定区域内人口进行测算,并且与传统方法相比,存在时效性强、测算区域边界自由、结果动态性强等优势。而且大数据的方法还可以对一日内不同时段内区域人口热力进行分析,这就为精确判断都市圈人口的职住分离情况成为可能。在实际研究中,我们运用联通手机信令数据对都市圈核心城市的人口规模以及人口热力分布进行分析;运用高德位置信息数据对国内几大机场周边人口集聚情况进行分析,这些研究都取得了很好的成果。
图:北京城市人口热力图
图片来源:智慧足迹、产新智库
图片来源:高德地图、产新智库
应用2:都市圈人口特征与通勤规律研究
对人群的特征画像和人群迁徙规律的研究是大数据分析的一大特色。百度、腾讯等大数据平台每年都会定期发布城市人群出行分析、城市群人口联系等系列报告。利用人口位置大数据,我们可以准确的分析特定人群的出行特征。需要指出的是,大数据方法的人口画像并非基于个体样本的统计分析,而是有指向性的对人口总体数据进行特征抓取,所以并不存在个人隐私泄露等问题。对于都市圈研究来讲,人口的出行规律与人口特征可以很直观地反映一个都市圈核心城市与外围的联系程度。以对城市极端通勤人口的研究为例,我们通过人口位置数据,对城市上班族通勤距离最远的10%的人群进行提取,评价城市通勤距离最远人群的通勤时间、职住分离情况、人群年龄结构甚至收入特征。在之前的研究中,产新智库曾以《睡在燕郊,梦在北京》为题,发表了对北京极端通勤人群的研究。未来都市圈研究中心会继续推出相关研究成果。
图片来源:高德地图、产新智库
应用3:都市圈空间范围的划定
都市圈体现了核心城市的实体功能地域,那么都市圈空间范围的划定,就成为都市圈研究的重要议题。类似概念中,美国的大都市区把周边县与中心城市之间的双向就业通勤量达到就业人数的25%及以上划为都市区范围;1970年日本统计局定义大都市圈是人口100万以上的政令指定市,外围区域向中心城市通勤率不低于15%。都市圈研究中心在确定都市圈的空间范围时,充分利用大数据方法的可行性,把等时圈和通勤率作为两项核心的参考依据。等时圈是指从城市的中心出发,在一定时段内所能到达的最大通勤圈的范围;通勤率是指两个地区之间的通勤人口数量,占地区人口的比重。传统方法对等时圈的测算不得不面临交通线路选择、速度赋值、建模等问题,而当前利用高德、百度地图等手段,我们可以精准方便的估算从某地到另一地的实际通勤时间。同样手机信令数据的运用也很好地解决通勤率测算的难题。运用大数据方法,我们对重点都市圈的范围进行了测算,并对结果与行政边界进行了对比分析,研究结论对于都市圈潜力区域的拓展具有重要意义。
图片来源:产新智库
应用4:都市圈产业的空间布局研究
产业落到空间上就形成了一个区域内的产业空间布局结构。对于都市圈来讲,研究其范围内产业的空间布局特征以及变化规律,有助于揭示都市圈经济发展规律。在对都市圈产业的研究中,企业空间位置信息以及企业内部的经营、投资联系信息是研究的核心数据。企业大数据平台的开发为获取相关信息提供了新的途径和手段。简便的方法如通过爬虫技术对网络大数据平台的指定POI信息进行抓取,对于指定企业也可以通过天眼查等工具快捷地查询其注册信息、股东信息等。但更精确的分析还需要专业的企业大数据平台。如最初基于智能图像识别技术做名片管理的启信宝,通过对名片信息的挖掘开发了更有价值的企业大数据信息平台。基于企业大数据信息,一方面对于产业的空间布局特征进行分析,发现了都市圈产业从中心到外围的“三二一”逆序化分布规律;另一方面通过对特定行业的分析,发现如食品加工、出版印刷、高端纺织等都市型工业呈现“轻型化”、“智能化”、“小型化”等特征;最后,通过对企业上下游产业链的分析,发现了大都市圈围绕产业要素和集聚环境,通过链状协同和云状协同形成梯度产业分布格局。
图:北京都市圈的大数据IDC分布
图片来源:产新智库
本文仅从研究角度介绍了对大数据应用的几点探索。在对大数据的运用中我们明显体会到,有效利用大数据对于认识都市圈具有重要的价值。当前大数据无论在覆盖度上还是相关平台的规模与技术实力上,都达到了爆发的临界点。同时,大数据平台公司自身也在不断拓展下游领域的应用场景,并且寻求多方协作。如今年6月的中国联通智慧城市专题论坛上,中科遥感携手联通成立新型智慧城市产业联盟,遥感大数据企业与移动通信大数据强强联合。诸如此类的合作无疑会在应用端产生极强的“乘数效应”。对于大数据在都市圈中的应用挖掘,也许更需要的是一点想象力。
都市圈是顺应时代发展的新理念,大数据是研究都市圈的新工具新方法。产新智库致力于成为中国都市圈的发展研究的高水平智库,通过运用大数据对都市圈进行研究,我们进一步确认都市圈必将成为推动中国经济社会发展的重要力量。尽管还存在着很多问题与羁绊,但我们愿意以更开放的姿态,不断探索新模式、尝试新方法,以期发现关于都市圈的更多精彩观点。
关注公众号,并回复“报告全文”,下载产新智库都市圈研究中心全文翻译的布鲁金斯学会《全球大都市监测报告2018》。